12.1 온라인 탐색의 한계와 오프라인 RL의 부상 12.1 온라인 탐색의 한계와 오프라인 RL의 부상 12.1.1 로봇 학습의 딜레마: 데이터 수집 비용과 안전성 문제 12.1.2 오프라인 RL vs 모방 학습: 보상(Reward)을 통한 전문가 초월하기 12.1.3 데이터 중심(Data-Centric) AI로의 전환: 알고리즘보다 데이터셋의 중요성